# 移除低方差的特征来减少数据集中的特征数量
from sklearn.feature_selection import VarianceThreshold
import numpy as np

# 创建一个包含低方差和高方差特征的示例数据集
X = np.array([[0, 2, 0, 3], [0, 1, 4, 3], [0, 1, 1, 3], [0, 1, 0, 3]])

# 低方差过滤：删除方差低于 0.01 的特征
var_thresh = VarianceThreshold(threshold=0.01)
X_filtered = var_thresh.fit_transform(X)
print(X_filtered)
